”reinforcement-learning unity deep-reinforcement-learning pytorch dqn deep-q-network reinforcement-learning-excercises ml-agents UnityPython“ 的搜索结果

     使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL,逆RL等关于这本书 近年来,随着算法质量和数量的显着提高,《 Python上的动手强化学习》第二版已完全改编为示例丰富的指南,用于学习...

     自动股票交易的深度强化学习:整体策略该存储库提供了代码的Jupiter Notebook重新实现了这种整体策略。抽象的股票交易策略在投资中起着至关重要的作用。 但是,在复杂而动态的股票市场中设计一种有利可图的战略是...

     使用OpenAI-Gym进行强化学习适用于古典和MuJoCo环境的强化学习算法SARSA,Q-Learning,DQN,并使用OpenAI Gym对其进行测试。SARSA推车杆SARSA(状态-行动-奖励-状态-行动)是一种简单的策略上强化学习算法,其中,...

     与超级强化学习一起玩《超级马里奥兄弟》 使用(双/决斗)Deep-Q网络玩超级马里奥兄弟。安装virtualenv 使用virtualenv将Python环境包含到python3的单个本地安装中:设置要设置虚拟环境: virtualenv -p python3 ....

      它包括通过深度Q学习及其增强功能(例如双Q学习,深度递归网络(使用LSTM),深度决斗架构和优先重放给异步优势参与者)的深度强化学习方法,训练代理在游戏DOOM的不同场景中玩。关键(A3C)和好奇心驱动的学习。 ...

     生成的基于专家的用户模型用于基于学习的推荐系统Pytorch的强化学习 基于纸张的下相同的标题剖成Adverserial强化学习基于用户模型实现推荐系统的Pytorch执行 此回购包括: 必要数据(Yelp评论) ...

     CuRL-针对目标机器人控制的课程强化学习我的MEng在计算(人工智能)最终项目中的代码档案,报告- 。 该项目的主要成果是CuRL-一种用于培训政策以完成面向目标的机器人任务的方法,而最新的深度强化学习则很难解决...

     很棒的深度强化学习深度强化学习(DRL)的精选列表:软件框架,模型,数据集,体育馆,基线... 为此,包括具有很多视觉示例的通用机器学习(ML),神经网络(NN)和深度神经网络(DNN),以及具有视频游戏/机器人...

     David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:...

     颠倒的强化学习 Pytorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文: 该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境(该环境的版本)的连续动作空间实现。...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1